package com.shixj.easy.spider.constant;

/**
 * Created by shixj on 2018/1/16.
 */
public class RegexContants {
    public static String DEFAULT_REGEX_NOVEL_SOURCE_ID="(?<=https?://www\\..{1,50}\\.com(\\.tw)?/).*(?=/)";//默认小说源id获取规则
    public static String DEFAULT_REGEX_CHAPTER_SOURCE_ID="(?<=https?://www\\..{1,50}\\.com(\\.tw){0,1}/\\d{1,20}_\\d{1,20}/).*(?=(/$)|(.html$))";//默认章节源id获取规则
    public static String DEFAULT_REGEX_NOVEL_NAME="div[id=info] h1";//默认小说名获取规则
    public static String DEFAULT_REGEX_AUTHOR="div[id=info] p";//默认作者获取规则
    public static String DEFAULT_REGEX_COVER="div[id=fmimg] img";//默认封面获取规则
    public static String DEFAULT_REGEX_DESCRIPTION="div[id=intro]";//默认章节内容获取规则
    public static String DEFAULT_REGEX_CONTENT="div[id=content]";//默认章节内容获取规则
    public static String DEFAULT_REGEX_TITLE="div[class=bookname] h1";//默认章节标题获取规则
    public static String DEFAULT_REGEX_CATALOG="dd a";//默认目录获取规则
}
